我们解决了新颖的类发现问题,旨在根据可见类别的数据在未标记的数据中发现新的类。主要的挑战是将所见类中包含的知识转移到看不见的知识中。先前的方法主要通过共享表示空间或关节标签空间传输知识。但是,他们倾向于忽略可见类别和看不见的类别之间的阶级关系,因此学习的表示对聚类的看不见类别的有效性较差。在本文中,我们提出了一种原理和一般方法,以在可见的和看不见的阶级之间传递语义知识。我们的见解是利用共同的信息来衡量受限的标签空间中看到的类和看不见的类之间的关系,并最大化相互信息可以促进传递语义知识的传递。为了验证我们方法的有效性和概括,我们对新型类发现和一般新型类发现设置进行了广泛的实验。我们的结果表明,所提出的方法在几个基准上优于先前的SOTA。
translated by 谷歌翻译
智能交通灯管制系统(ITLC)是一个典型的多机构系统(MAS),包括多条道路和交通信号灯。为ITLCS构造MAS模型是减轻交通拥堵的基础。 MAS的现有方法主要基于多代理深度强化学习(MADRL)。尽管MABRL的深神经网络(DNN)有效,但训练时间很长,并且很难追踪参数。最近,广泛的学习系统(BLS)提供了一种选择性的方法,可以通过平坦的网络在深层神经网络中学习。此外,广泛的强化学习(BRL)在单一代理深层增强学习(SADRL)问题中扩展了BLS,并具有有希望的结果。但是,BRL不关注代理的复杂结构和相互作用。由MADRL的特征和BRL问题的激励,我们提出了一个多机构的广泛强化学习(MABRL)框架,以探索BLS在MAS中的功能。首先,与大多数使用一系列深神经网络结构的MADRL方法不同,我们用广泛的网络对每个代理进行建模。然后,我们引入了动态的自我循环交互机制,以确认“ 3W”信息:何时进行交互,代理需要考虑哪些信息,要传输哪些信息。最后,我们根据智能交通灯控制场景进行实验。我们将MABRL方法与六种不同的方法进行比较,并在三个数据集上进行实验结果验证了MABRL的有效性。
translated by 谷歌翻译
We introduce an end-to-end computational framework that enables hyperparameter optimization with the DeepHyper library, accelerated training, and interpretable AI inference with a suite of state-of-the-art AI models, including CGCNN, PhysNet, SchNet, MPNN, MPNN-transformer, and TorchMD-Net. We use these AI models and the benchmark QM9, hMOF, and MD17 datasets to showcase the prediction of user-specified materials properties in modern computing environments, and to demonstrate translational applications for the modeling of small molecules, crystals and metal organic frameworks with a unified, stand-alone framework. We deployed and tested this framework in the ThetaGPU supercomputer at the Argonne Leadership Computing Facility, and the Delta supercomputer at the National Center for Supercomputing Applications to provide researchers with modern tools to conduct accelerated AI-driven discovery in leadership class computing environments.
translated by 谷歌翻译
基于骨架的人类行动识别是由于其复杂的动态而是一项长期挑战。动态的一些细颗粒细节在分类中起着至关重要的作用。现有的工作主要集中在设计带有更复杂的相邻矩阵的增量神经网络上,以捕获关节关系的细节。但是,他们仍然很难区分具有广泛相似运动模式但属于不同类别的动作。有趣的是,我们发现运动模式上的细微差异可以显着放大,并且可以轻松地通过指定的视图方向来区分观众,在这些方向上,该属性以前从未得到充分探索。与以前的工作截然不同,我们通过提出一种概念上简单而有效的多视图策略来提高性能,该策略从一系列动态视图功能中识别动作。具体而言,我们设计了一个新颖的骨骼锚定建议(SAP)模块,该模块包含一个多头结构来学习一组视图。为了学习不同观点的特征学习,我们引入了一个新的角度表示,以在不同视图下的动作转换并将转换归因于基线模型。我们的模块可以与现有的动作分类模型无缝合作。与基线模型合并,我们的SAP模块在许多具有挑战性的基准上展示了明显的性能增长。此外,全面的实验表明,我们的模型始终击败了最新的实验,并且在处理损坏的数据时保持有效和健壮。相关代码将在https://github.com/ideal-idea/sap上提供。
translated by 谷歌翻译
无监督的对比度学习(UCL)是一种自我监督的学习技术,旨在通过将正面样本彼此接近,同时将负面样本推到嵌入空间中远处,以学习有用的表示功能。为了提高UCL的性能,几项作品引入了旨在选择“硬”阴性样本与UCL中使用的随机采样策略相比,旨在选择“硬”阴性样本的硬性阴性对比度学习(H-UCL)。在另一种方法中,在假设标签信息可用的假设下,有监督的对比学习(SCL)最近通过将UCL扩展到完全监督的环境来开发。在本文中,由于硬性采样策略在H-UCL中的有效性以及标签信息在SCL中的有用性的启发性,我们提出了一个称为硬性负责监督的对比度学习(H-SCL)的对比学习框架。我们的数值结果证明了H-SCL在几个图像数据集上对SCL和H-UCL的有效性。另外,从理论上讲,在某些条件下,H-SCL的目标函数可以受H-UCL的目标函数的界定,而不是由UCL的目标函数界定。因此,将H-UCL损失最小化可以作为最小化H-SCL损失的代理,而最小化UCL损失不能。正如我们数值表明H-SCL优于其他对比学习方法时,我们的理论结果(通过H-UCL损失界限H-SCL损失)有助于解释为什么H-UCL在实践中优于UCL。
translated by 谷歌翻译
我们提出Automerge,这是一种LIDAR数据处理框架,用于将大量地图段组装到完整的地图中。传统的大规模地图合并方法对于错误的数据关联是脆弱的,并且主要仅限于离线工作。 Automerge利用多观点的融合和自适应环路闭合检测来进行准确的数据关联,并且它使用增量合并来从随机顺序给出的单个轨迹段组装大图,没有初始估计。此外,在组装段后,自动制度可以执行良好的匹配和姿势图片优化,以在全球范围内平滑合并的地图。我们展示了城市规模合并(120公里)和校园规模重复合并(4.5公里x 8)的汽车。该实验表明,自动化(i)在段检索中超过了第二和第三最佳方法的14%和24%的召回,(ii)在120 km大尺度地图组件(III)中实现了可比较的3D映射精度,IT对于暂时的重新审视是强大的。据我们所知,Automerge是第一种映射方法,它可以在无GPS的帮助下合并数百公里的单个细分市场。
translated by 谷歌翻译
沟通对于代理人共享信息并做出良好决定的许多多代理强化学习(MARL)问题很重要。但是,当在存在噪音和潜在攻击者的现实应用程序中部署训练有素的交流代理商时,基于沟通的政策的安全就会成为一个严重的问题,这些问题被忽视。具体而言,如果通过恶意攻击者操纵沟通信息,依靠不信任的交流的代理可能会采取不安全的行动,从而导致灾难性后果。因此,至关重要的是要确保代理人不会被腐败的沟通误导,同时仍然从良性的交流中受益。在这项工作中,我们考虑了一个具有$ n $代理的环境,攻击者可以任意将通信从任何$ c <\ frac {n-1} {2} $代理商转换为受害者代理。对于这种强大的威胁模型,我们通过构建一个消息集结策略来提出可认证的辩护,该策略汇总了多个随机消融的消息集。理论分析表明,这种消息安装策略可以利用良性通信,同时确保对对抗性交流,无论攻击算法如何。在多种环境中的实验证明,我们的防御能够显着改善受过训练的政策对各种攻击的鲁棒性。
translated by 谷歌翻译
间质性肺部疾病是一大批以不同程度的肺泡炎和肺纤维化为特征的异质性疾病。准确地诊断这些疾病对于制定治疗计划具有显着的指导价值。尽管以前的工作在分类间隙肺部疾病方面取得了令人印象深刻的结果,但仍有提高这些技术准确性的空间,主要是为了增强自动决策。为了提高分类精度,我们的研究提出了一个基于卷积神经网络的框架,并提供了其他信息。首先,通过在Hounsfield单元中重新缩放原始图像,并添加了ILD图像。其次,修改的CNN模型用于为每个组织产生分类概率的载体。第三,输入图像的位置信息,包括在某些位置在CT扫描中不同疾病的发生频率组成,用于计算位置权重向量。最后,使用两个向量之间的Hadamard产品用于为预测产生决策向量。与最先进的方法相比,使用公开可用的ILD数据库的结果显示了使用不同的其他信息预测这些数据的潜力。
translated by 谷歌翻译
对于长期自治,大多数位置识别方法主要在简化的方案或模拟数据集上进行评估,该数据集无法提供可靠的证据来评估当前同时定位和映射的准备就绪(SLAM)。在本文中,我们提出了一个长期的位置识别数据集,用于在大规模动态环境下用于移动定位。该数据集包括一个校园规模的轨道和城市规模的轨道:1)校园轨道重点关注长期财产,我们在10个轨迹上记录Lidar设备和一个全向相机,并且每个轨迹在变体下重复记录8次照明条件。 2)城市轨道聚焦大型物业,我们将激光雷达设备安装在车辆上,并穿过120公里种类在城市环境中。每个轨迹都提供了两个轨道的地面真实位置,这是从全球位置系统中获得的,具有额外的基于ICP的点云的细化。为了简化评估程序,我们还为Python-API提供了一组地点识别指标,以快速加载我们的数据集并根据不同方法评估识别性能。该数据集的目标是寻找具有高位置识别精度和鲁棒性的方法,并提供长期自治的真正机器人系统。可以从https://github.com/metaslam/alita访问数据集和提供的工具。
translated by 谷歌翻译
本文考虑了Barycentric编码模型(BCM)下的测量估计问题,其中假定未知的度量属于有限的已知测量集的Wasserstein-2 Barycenters集合。估计该模型下的度量等同于估计未知的Barycentric坐标。我们为BCM下的测量估计提供了新颖的几何,统计和计算见解,由三个主要结果组成。我们的第一个主要结果利用了Wasserstein-2空间的Riemannian几何形状,以提供恢复Barycentric坐标的程序,作为假设对真实参考度量访问的二次优化问题的解决方案。基本的几何见解是,该二次问题的参数是由从给定度量到定义BCM的参考度量的最佳位移图之间的内部产物确定的。然后,我们的第二个主要结果建立了一种算法,用于求解BCM中坐标的算法,当时通过I.I.D进行经验观察到所有测量。样品。我们证明了该算法的精确收敛速率 - 取决于基本措施的平稳性及其维度 - 从而保证其统计一致性。最后,我们证明了BCM和相关估计程序在三个应用领域的实用性:(i)高斯措施的协方差估计; (ii)图像处理; (iii)自然语言处理。
translated by 谷歌翻译